Parallel Coordinates
http://en.wikipedia.org/wiki/Parallel_coordinates http://gyazo.com/e57c73ec20244a414ad698ea8a19570e.png
単純だし決してわかりやすいわけでは
例えば、1970年から1982年に発売された車に関する以下のようなデータがあったとする。
http://gyazo.com/a2f26d55ad685c750f7b3369fc74b249.png
このデータはぱっと見る感じ傾向をつかみにくいんだけど、ParallelCoordinatesで見せるとわかりやすくなりますよ、というお話。
データの列を横軸にとり、縦軸にその列のデータをプロットして同じ行に属している点同士を線で繋ぐと、以下のようなグラフができる。(説明が下手)
http://gyazo.com/f70ac98ae97491058a3c997e255678a7.png
一番左のMPG(燃費)とCylinderの間の線を見てみましょう。これを見ると、8シリンダーの車はMPGが低くて、2シリンダーの車はMPGが高い、つまり燃費が高い事がすぐわかる。
同じように、馬力と車重にはあんまりぱっとした関係はなさそう、発売年が遅くなればなるほど(新しければ新しい程)車重が下がって行くのが見て取れる。
ただ、この見方だとはなれた項目どうしの傾向なんかは見る事ができない。シリンダー数と発売年のように。
それから、シリンダー数と発売年と車重とか、そういう2より多い項目同士の関係も見づらい。
http://gyazo.com/f4b56a6079d405084c11c3cf48cc9498.png
こんなふうに選択した部分の線を目立たせてみる。
そうすると、この場合は1980年から82年に発売された車の傾向がなんとなく見える。
http://gyazo.com/98d1583a7f028ded275782bf50daf2fd.png
こっちは1970年から72年に発売された車の傾向。比較にも使える。
ProtoVizだと、ドラッグして選択したところが目立つようになっててまあまあわかりやすいかも
欠点
次元が増えすぎるとわけわかんなくなる
データ量が増えてもわけわかんなくなる
ParallelCoordinatesするとわけわかんなくなるデータを勝手にクラスタリングしてわかりやすくするような可視化ソフトは前に見た事がある。
このポスターだった。生物学のデータをParallelCoordinatesで可視化するソフトを作ってた人が見せてくれたデモにそういう機能があった。 でも多分公開してない。
応用例
あとで追加
http://gyazo.com/2bc58cbd5dffdb3b4b595ff042ad8978.png
増井俊之.icon
ある程度便利なのかもしれないが見栄えが悪いのはなんとかならないのか